بازشناسی متون چاپی با بهره گیری از کدگذاری شکل و اطلاعات معنایی زمینه

thesis
abstract

بازشناسی متون چاپی، از جمله زمینه های پرکاربرد بازشناسی الگو است. تاکنون تحقیقات متعددی در زمینه ی بازشناسی متون چاپی فارسی و عربی صورت گرفته است اما این تحقیقات، غالبا با محدودیت های فراوانی به ویژه در حوزه ی عملیاتی شدن، همراه بوده اند. کلیه ی تحقیقات انجام شده در این حوزه را می توان در قالب سه رویکرد مبتنی بر جداسازی حروف، رویکرد مبتنی بر بازشناسی شکل کلی زیرکلمات و رویکرد ترکیبی، تقسیم بندی نمود. در این پژوهش سعی شده است تا دو راهکار در زمینه ی رویکرد بازشناسی مبتنی بر شکل کلی کلمات و رویکرد ترکیبی ارائه شود. در راهکار نخست که مبتنی بر رویکرد شکل کلی کلمات می باشد، ابتدا به ارائه ی الگوی باینری محلی هرمی، به عنوان یک روش استخراج ویژگی مستقل از چرخش و کارا در حوزه ی تشخیص زیرکلمات چاپی پرداخته شده و سپس با بهره گیری از خوشه بندی فازی و شبکه های عصبی توابع پایه شعاعی، عملیات بازشناسی انجام می پذیرد. آزمایشات صورت گرفته حاکی از آن است که راهکار پیشنهادی با دقتی در حدود 97.81 درصد، قادر به تفکیک و تشخیص زیرکلمات چاپی می باشد. در راهکار دوم که مبتنی بر رویکرد ترکیبی است، نخست، گروهی از حروف ابتدا، میانه و انتهای کلمات، که با دقت بالایی قابل جداسازی و بازشناسی می باشند، به عنوان حروف شاخص مشخص می شوند و سپس با بهره گیری از الگوریتم ژنتیک و عملگرهای مورفولوژی، مجموعه ای ازعملگرهای مورفولوژی به همراه عناصر ساختاری بهینه که قادر به توصیف مناسب هر یک از گروه ها هستند مشخص شده و زیر کلمات هر یک از گروه ها بر اساس این حروف شاخص، کدگذاری می شوند. سپس یک دیکشنری تصویری، بر اساس زیرکلمات کد شده، ایجاد شده و در نهایت، عملیات بازشناسی زیرکلمات از طریق یک شبکه عصبی توابع پایه شعاعی و به کارگیری ویژگی موجک صورت پذیرفته است، صورت می پذیرد. در پایان این پژوهش نیز به منظور بکارگیری اطلاعات معنایی زمینه، به بررسی بهره گیری از مدل زبانی srilm در سطح کلمه و زیرکلمه بر روی یک سیستم پیشنهادی، پرداخته شده است. کلمات کلیدی بازشناسی متون، خوشه بندی فازی، شبکه عصبی توابع پایه شعاعی، الگوریتم ژنتیک، مدل زبانی

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

بازشناسی متون چاپی فارسی

برای بازشناسی کلمات سه رویکرد مبتنی بر جداسازی، مبتنی بر بازشناسی کلمه یک الگوی واحد و رویکرد ترکیبی مطرح است . در این رساله یک سیستم برای بازشناسی متون چاپی فارسی با استفاده از رویکرد ترکیبی ارائه شده است . یک الگوریتم جدید برای جداسازی حروف در کلمات چاپی بدون توجه به نوع قلم ارائه شده است . مراحل مختلف الگوریتم شامل تعیین نوار زمینه، تصحیح آن و جداسازی حروف است . در تعیین نوار زمینه روش جدیدی...

15 صفحه اول

بازشناسی متون چاپی فارسی با استفاده از مدل پنهان مارکوف

این پایان نامه روشی برای بازشناسی متون چاپی فارسی و زبان های دارای الفبای مشابه آن مانند عربی ارائه می دهد. بازشناسی آخرین مرحله در فرآیند ocr است که در آن به وسیله ویژگی های به دست آمده از تصویر، متن موجود در آن تشخیص داده می شود. تصویر مورد استفاده، در مراحل قبل پیش پردازش شده، انواع نویزها و چرخش آن برطرف گشته، و در نهایت دودویی شده است. در این روش، نوع و اندازه قلم یا قلم های استفاده شده در...

بازشناسی متون فارسی با استفاده از روشهای گرامری و معنایی

یکی از رایجترین اشکال انتقال اطلاعات، کاغذ می باشد. حجم زیادی از اطلاعات از طریق کاغذ منتقل می شوند. مستندات کاغذی از تنوع زیادی برخوردار هستند به عنوان مثال اطلاعات روی کاغذ می تواند شامل متون چاپی یا دست نویس، جداول، منحنی ها، تصاویر و ... باشد. ترکیب این اطلاعات بر روی اسناد کاغذی و همچنین استفاده از انواع مختلف قلم ها و ویژگی های خاص باعث دشواریهایی در بازیافت اطلاعات می گردد. علاوه بر این ...

15 صفحه اول

زمینه های شکل گیری شایعه و راهکارهای مقابله با آن از نگاه قرآن

شایعه، از مهم ترین پدیده های اجتماعی به حساب می آید که همواره به عنوان نوعی تاکتیک تبلیغاتی مورد استفاده قرار می گیرد. ضرورت آشنایی افراد جامعه، به ویژه جوامع دینی با موضوع شایعه به اندازه ای است که قرآن بارها در خلال آیاتش به آن اشاره کرده است. بیان و تحلیل زمینه های شکل گیری شایعات از یک سو و ارائه راه کار جهت مدیریت این آسیب مخرب از دیگر سو، رویکرد متکاملی است که قرآن به آن دارد. توجه به قدر...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023